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fi 要 : [目的 /意义 ] 通 过 比较 分 析 不 同 的 突破 性 创新 识别 方法 ,总 结 现 有 方法 存在 的 问题 ,将 弱 信 号 引入 突破 性 创新 研 
究 的 识别 中 ,重点 关注 突破 性 创新 早期 的 各 类 弱 信 号 ,尤其 是 弱 关 联 关 系 分 析 , 以 期 实现 早期 预 判 。[ 方 法 /过 程 ] 
首先 ,通过 调研 现 有 的 识别 方法 ,提炼 当前 存在 的 主要 问题 ,指出 研究 弱 信 号 的 必要 性 。 之 后 ,从 不 同 的 学 科 角 度 
介绍 弱 信 号 的 内 涵 及 表征 形式 ,对 其 特征 进行 概括 ,梳理 弱 信 号 的 几 种 识别 方法 。 最 后 介绍 弱 关 系 分 析 的 内 涵 及 
应 用 ,提出 借鉴 多 元 关系 融合 算法 模型 可 以 实现 多 种 弱 关 系 的 有 效 融 合 ,获取 更 明确 的 信息 。[ 结果 /结论 ] 突破 


i: 突破 性 创新 早期 识别 
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弱 信 号 


性 创新 的 识别 研究 中 受 关注 最 多 是 文献 间 的 引用 关系 、 主 题词 之 间 的 语义 关系 等 强 关 系数 据 ,而 弱 关 系 冀 含 着 更 
多 元 化 的 信息 ,加 强 弱 关系 分 析 可 以 实现 对 突破 性 创新 研究 的 早期 预 判 。 未 来 研究 需要 寻求 有 效 捕捉 弱 关联 的 


方法 ,注重 主题 的 动态 演化 规律 ,如 利用 高 阶 网络 模 型 分 析 有 效 弱 信号 ,提高 突破 性 创新 早期 识别 的 准确 性 。 
BRR 关系 融合 


44 第 六 次 科技 革命 ,科学 技术 体 
系 示 断 涌现 重大 突破 ,并 深刻 改变 着 社会 的 经 济 面貌 。 
柱 邓 于 浙 进 性 研究 ,突破 性 创新 的 创新 程度 更 高 ,代表 
着 科技 创新 过 程 中 最 具 前 脆性 的 发 展 方向 。 如 何 从 新 
兴 宇 题 中 识别 和 预 判 具有 突破 性 创新 的 重大 发 现 ,对 
政 辆 的 制定 和 企业 的 战略 布局 都 至 关 重 要 。 尽 可 能 早 
地 识别 出 重大 突破 ,政府 和 企业 就 能 够 及 时 调整 科技 
战略 ,合理 分 配 研 发 资源 ,有 更 多 的 应 对 时 间 抢 得 发 展 
先 机 。 但 是 许多 科学 突破 和 创造 性 的 发 现 , 在 发 展 早 
期 都 具有 较 高 的 不 确定 性 和 模糊 性 ,增加 了 早期 迹象 
分 析 的 难度 。 因 此 ,如 何在 研究 项 目的 开始 时 期 关注 
早期 迹象 , 预 判 其 未 来 的 变革 潜力 是 科学 政策 和 研究 
评估 中 亟待 解决 与 最 具 挑战 性 的 问题 。 

尽管 已 经 存在 着 多 种 突破 性 研究 的 识别 方法 ,但 
识别 结果 大 多 已 是 在 研究 领域 的 快速 发 展期 或 成 熟 


期 ,难以 做 到 早期 发 现 。 目 前 以 专家 判断 为 主 的 定性 
方法 是 研判 未 来 科技 发 展 趋势 的 重要 手段 ,但 是 随 着 
学 科 融 合 与 数据 的 爆炸 式 涌现 ,专家 智慧 难以 快速 、 准 
确 的 发 挥 最 佳 效 能 。 探 测 突破 性 创新 常用 的 定量 方 
法 ,如 引文 网 络 分 析 、 主 题 突变 检测 、 睡 美人 文献 分 析 
及 技术 演化 法 ,多 注重 高 引用 、 强 共 现 等 “ 强 信号 ”分 
析 MATRA AAA BEA fo” o 
号 预示 着 未 来 的 变化 ,具体 表征 形式 多 是 某 种 现象 . 事 
件 .机 会 或 威胁 ,分 析 弱 信号 可 以 辅助 更 早 地 了 解 和 控 
制 事物 的 未 来 发 展 。 

鉴于 此 ,本 研究 遵循 科学 发 展 规律 ,考虑 科学 发 展 
过 程 中 的 不 确定 性 ,综述 弱 信 号 分 析 方 法 及 将 其 应 用 
于 突破 性 创新 识别 的 可 能 性 。 本 文 首先 介绍 突破 性 创 
新 的 相关 概念 ,总 结 突破 性 创新 的 非 线性 ,不 确定 性 等 
特征 ;之 后 梳理 现 有 突破 性 研究 的 识别 方法 ,总 结 现 有 
方法 存在 的 问题 ;在 此 基础 上 引入 弱 信 号 ,介绍 其 概 
念 ,特征 及 识别 方法 ,阐述 弱 信 号 用 于 突破 性 创新 早期 
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识别 的 可 行 性 ;最 后 给 出 未 来 突破 性 创新 的 早期 识别 
研究 中 可 以 深入 探讨 的 地 方 。 


2 研究 现状 


之 后 G. Dosi 和 R. R. Nelson 发 表 的 《技术 范式 与 技术 
轨道 》 将 突破 性 技术 创新 与 渐进 性 技术 创新 统一 到 一 
个 理论 框架 内 ,开启 了 对 突破 性 创新 的 研究 探索 "|。 
人 研究 人 员 对 于 突破 性 创新 的 理解 与 认 知 不 尽 相 同 , 通 


2.1 突破 性 创新 的 内 涵 过 调研 发 现 ,大 多 数 研 究 的 关注 点 集中 在 :中 技术 改 
2.1.1 突破 性 创新 的 定义 进 产品 性 能 的 提高 ,市场 价值 ;思科 学 研究 中 的 突破 
突破 性 创新 起 源 于 熊 彼 特 的 “创造 性 的 破坏 ” " ，| 性 发 现 , 全 新 的 知识 理论 基础 。 如 表 1 所 示 : 
表 1 突破 性 创新 的 相关 定义 
研究 重点 概念 内 涵 代表 性 研究 
技术 改进 .产品 性 能 及 ”是 一 种 非 连 续 性 的 ,革命 性 的 创新 ,会 有 全 新 的 科技 知识 和 资源 ,并 会 淘汰 现 有 的 技术 和 产品 M. L. Tushman 和 
市 场 价值 提升 P. Anderson[3] 
使 产品 .工艺 或 服务 具有 全 新 的 性 能 特征 或 虽 具 有 相似 的 特征 但 性 能 大 幅 提 高 且 成 本 降低 ,或 V. Kotelnikov[4] 
创造 出 能 够 改变 现 有 市 场 和 产业 的 新 产品 省 海 林 和 董 慈 兹 [1 
是 将 新 奇 .独特 和 精妙 的 技术 引入 新 的 产品 ,并 可 以 改变 市 场 消费 模式 的 一 种 创新 ,能 显著 提升 K. Z. Zhoul6] 
= 技术 水 平和 顾客 价值 孙 晓 雅 和 陈 娟 娟 中 ] 
> 是 一 种 技术 .产品 ,过程 和 商业 模式 上 的 创新 ,能 对 现 有 的 产品 和 服务 进行 改造 , 启 得 顾客 市 场 B. Fores #11 C. Camison[s] 
Le) 两 个 层次 ;一 方面 是 现 有 技术 的 应 用 和 组 合 产生 的 市 场 突破 性 ; 另 一 方面 则 是 指 技术 层面 的 不 。 张 金 柱 和 张晓林 [91 
OO) 连续 性 
(各 研究 中 的 突破 性 创新 突破 性 创新 常 与 科学 革命 联系 在 一 起 ,使 科学 范式 发 生 改 变 。 科 学 发 展 是 在 常规 研究 与 革命 性 T. S. Kuhn 01 
O 研究 两 种 状态 的 相互 交替 转换 中 进行 的 
© 突破 性 创新 研究 可 以 消除 科学 进步 的 障碍 ,可 能 创造 新 的 理论 或 改进 现 有 的 理论 ,更 好 地 描述 K. B. Wray l'1) 
<p 已 知 的 现象, 但 都 受到 科学 规范 的 约束 
© 突破 性 创新 可 能 会 彻底 改变 该 领域 的 认 知 结构 ,延伸 出 新 领域 的 研究 ,往往 与 当前 的 科学 领域 H. Andersen 等 [12] 
CD 内 占 主导 地 位 的 理论 框架 不 相 容 杜 建 等 [3] 
N SEER ERIK E KREE OAE RUBORE OA IE OERO (EAEE EY BR P. Galison! 14] 
© 斥 了 库 恩 常规 科学 与 变革 性 科学 交 蔡 出 现 的 观点 A. V. Raan[ 15] 
N 突破 性 创新 是 一 个 过 程 ,通过 无 数 连续 的 微小 的 ,渐进 的 进步 产生 一 种 思考 问题 的 新 方式 ,科学 J.R. Hollingsworth L16 
发 展 并 没有 界限 分 明 的 范式 转化 


2 为 纪 。 突破 性 创新 的 特征 

突破 性 创新 的 特征 较为 复杂 ,在 研究 学 界 尚未 形 

成 三 至 和 全 面 的 解读 。 本 文 重点 分 析 了 研究 人 员 对 基 

码 释 学 研究 中 突破 性 创新 的 特征 描述 ,如 表 2 所 示 : 
R2 突破 性 创新 的 特征 


na 


特征 特征 描述 


突破 性 研究 通常 建立 在 新 的 科学 原理 或 者 技术 手 
段 之 上 ,引领 科技 坟 来 发 展 
非 线性 /不 连续 。 科学 发 展 是 非 线性 的 ,突破 性 创新 研究 可 能 会 引 
性 10.19-20] ”不 连续 的 断层 现象 
不 确定 性 521 -21 每 一 项 突破 都 有 侦 然 性 的 因素 ,突破 性 创新 发 展 过 
程 中 存在 很 强 的 不 确定 性 ,预测 难度 较 大 


新 颖 性 /前 瞻 性 :7 18) 


(a 


通过 对 突破 性 创新 的 定义 及 特征 梳理 可 知 ,突破 
性 创新 对 未 来 科技 发 展 产生 重大 影响 。 科 学 发 现 与 它 
们 在 技术 上 的 结合 ,可 能 需要 跨越 数 十 年 ,在 研究 与 开 
发 (R&D) 系 统 中 通常 以 复杂 的 方式 相互 联系 。 所 以 
本 研究 关注 基础 研究 ,聚焦 于 知识 创新 侧 来 的 科学 进 
程 中 的 突破 性 发 现 , 暂 不 考虑 技术 领域 以 及 对 市 场 的 
不 确定 性 影响 。 


2.1.3 ”突破 性 创新 的 分 类 及 可 预测 性 
突破 性 创新 的 产生 契机 及 变革 程度 存在 差别 ， 
此 突破 性 创新 存在 多 种 形式 ,其 识别 预测 的 难度 也 不 
同 。 当 前 还 没有 统一 的 分 类 标准 ,D. EF. Koshland 回顾 
科学 发 展 史 将 突破 性 创新 分 为 3 种 类 型 ,形成 了 有 较 
大 影响 的 “Cha-Cha-Cha” 理 论 ”1 ,如 表 3 所 示 : 
表 3 突破 性 创新 分 类 


类 型 具体 描述 侧重 点 
Charge 型 这 类 发 现 是 针对 大 家 每 个 ”现象 已 经 存在 ,不 需要 刻意 
人 都 会 看 到 的 现象 ,如 苹果 感知 ,重点 在 于 揭示 现象 背 
FA .星星 转动 ,思考 这 些 ”后 的 原因 


现象 的 原因 ,给 出 理论 来 解 
释 这 些 现 象 
“解释 异常 现象 , 即 为 当 
对 的 科学 理论 无 法 解释 的 
事实 提供 新 的 概念 、 理 论 或 
新 的 解决 方案 
被 称 为 偶然 发 现 , 是 研究 人 
员 偶然 发 现 的 现象 或 事实 


Challenge 型 要 求 科 研 人 员 能 够 感知 异 
常 ,意识 到 它们 的 重要 性 ， 
设计 新 的 概念 或 理论 解释 
主要 是 看 到 偶然 的 现象 并 
研究 偶然 "事故 "是 如 何 引 
发 的 


Chance 型 


从 表 3 的 分 类 结果 可 以 看 出 ,Chance 型 科学 突破 
是 在 特殊 的 环境 或 经 历 机 缘 巧 合 的 事件 被 发 现 , 除 此 
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之 外 ,大 多 数 推动 科学 进程 发 展 的 突破 性 创新 并 不 是 
偶然 ,需要 研究 人 员 思考 各 类 事实 和 问题 ,将 这 些 独立 
的 .看 似 不 相关 的 信息 联系 起 来 。 

一 项 突破 性 创新 的 出 现在 现 有 的 科学 体系 中 常 被 
认为 是 “不 连续 性 ”的 ,属于 “间断 性 发 展 "。 实 际 上 如 
果 “ 放 大 ” 断 点 之 处 的 具体 内 容 , 从 突破 本 身 相关 的 内 
容 或 解决 的 问题 来 看 ,这 种 突破 与 先前 的 研究 是 存在 
关联 的 , 它 的 产生 ,发 展 过 程 是 “连续 性 ”的 ,这 是 突破 
性 创新 可 以 预测 的 前 提 。 本 文 在 直角 坐标 系 中 绘制 科 
学 创新 发 展 过 程 进行 解释 ,图 1 中 0 为 坐标 原点 、 横 轴 
为 时 间 维度 . 纵 轴 为 创新 性 维度 。 工 .I M .TV 为 科学 
发 展 的 4 个 渐进 性 创新 阶段 ,A、B、C 表示 4 阶段 过 程 
中 的 “跳跃 性 ”突破 性 创新 。 将 其 “放大 ”后 可 知 ,突破 
性 创新 的 产生 .发展 是 有 迹 可 循 的 ,有 进行 提前 预测 的 
nite. 

CG) itt #£ “ Cha-Cha-Cha” 理论 中 , Chance 型 这 类 
PSR S A MI Ae SAF E MEDL ,不 确定 性 因 
素 难以 进行 提前 预测 。 而 对 于 Charge 型 和 Chal- 
lenge 型 而 言 ,大 多 数 应 该 都 是 有 迹 可 循 的 ,研究 通 
迁 深 入 挖掘 突破 性 研究 发 表 初 期 的 * 预警 信号 ”, 分 


A 说明: 

科学 创新 | DIV 是 科学 发 展 中 的 渐进 性 创 

新 ， 嘴 连续 性 的 ; iy 
OA, B. CREER PIRRE 
Si, RITES ER IA 也 


实际 的 突破 性 创新 进程 


SP NH | 可 利用 的 
| 早期 信号 

| ( 弱 信号 ) 

| 

1 放大 后 可 知 ， 突 破 性 创新 的 产 

生 、 发 展 是 有 迹 可 循 的 连续 过 
? 程 ， 恒 点 在 于 把 所 早期 迹象 ， 

挖 扎 背 后 的 内 在 关联 


a 
时 间 
0 时 间 


图 1 科学 发 展 进程 中 的 突破 性 创新 


2.2 突破 性 创新 识别 方法 

突破 性 创新 的 早期 信号 较 少 ,识别 难度 较 大 。 因 为 
突破 性 创新 往往 与 现 有 的 科学 理论 相抵 触 ,违背 或 超越 
了 人 们 的 认 知 和 技术 水 平 ,科学 共同 体 习 惯 进行 抵 
制 ” 。 研 究 人 员 对 突破 性 研究 的 主题 识别 方法 进行 了 
探索 ,以 专家 判断 为 主 的 定性 分 析 方法 依然 是 探测 突破 
性 研究 的 重要 手段 ,但 是 在 学 科 交 又 融合 的 大 科学 时 
代 , 完 全 依靠 专家 个 人 对 某 个 学 科 领 域 的 了 解 和 经 验 可 
能 无 法 获得 最 准确 的 结果 。 数 据 处 理 、 分 析 工 具 及 算法 
层出不穷 ,成 为 专家 判断 过 程 中 的 有 效 辅助 手段 。 通 过 


(CB ELH. 梳理 当前 定量 识别 方法 ,可 以 发 现 不 同 的 识别 方法 具有 
N 一 定 的 适用 范围 ,各 有 优 缺点 ,如 表 4 所 示 : 
> 表 4 ”突破 性 研究 主题 识别 方法 对 比分 析 


只 别 方法 


方法 说 明 优势 


不 足 代表 性 研究 


Crowe: 。 ”利用 专家 的 智慧 和 经 验 识别 预 
SC 测 科技 发 展 态势 


专家 有 完备 的 知识 体系 和 充足 ”主观 性 强 ; 学 科 交叉 融合 的 时 代 
的 经 验 ,适用 于 单一 学 科 领 域 


《 麻 省 理工 科技 评论 》[251、 


背景 下 ,效率 低 ,准确 性 不 强 《2019 科学 发 展 报告 》[26] 


-二 
ASEITA 针对 文献 间 的 引用 和 被 引用 关 引文 间 体现 了 文献 内 容 的 相关 
系 ,构建 网 络 ,进行 共 被 引 网 络 ”性 ,可 以 客观 反映 科学 领域 的 发 


分 析 或 耦合 分 析 展 及 学 科 间 的 关系 


a 
DEH 
vet 
© 


uo 


通过 分 析 突 发 词 状态 的 变化 发 

现 突破 性 创新 
睡 美人 文献 分 析 法 对 睡 美人 论文 和 
探索 此 类 文献 中 可 能 孕育 的 洪 
在 突破 性 研究 


TJ 


监测 法 ”关注 主题 词 的 变化 及 离 群 数据 ， 究 对 象 为 主题 词 ,分 析 粒 度 更 
al ,动态 性 和 时 效 性 更 强 


利 深入 分 析 ， ”科学 和 技术 领域 都 有 延迟 承认 
现象 ,缩短 突破 性 创新 成 


的 认 的 一 小 部 分 ,只 能 作为 识别 科学 


存在 滞后 性 ,只 有 当 文 献 达 到 一 
定 的 被 引 次 数 才能 得 到 关注 


H. G. Small {27 |J. W. Schneider 
和 R. Costas[28] J. Wang 
4w [29] „J. Winnink [21] 

李 勇 等 [30] J, Kleinberg!!! aK 
金 柱 和 张 晓 林 [32] „J. Yoon 和 
K. Kim133] 罗素 平等 [34] 

N. Palomeras135]、 杜 建 136] | A. 
F. J. Van Raan 和 J. J. Win- 
突破 的 补充 手段 er 
不 同学 科 领 域内 突破 性 创新 的 


忽视 文献 间 和 主题 词 间 的 语义 
关联 ,不 能 很 好 地 揭示 学 科 领 域 
的 整体 知识 结构 
睡 美人 文献 仅仅 是 科学 文献 中 


A. Sood 和 G. J. Tellis [38] .G. J. 


技术 演化 视角 从 技术 轨道 的 转换 论 角度 出 发 ， “突破 性 创新 常 出 现在 新 旧 技术 


分 析 法 在 新 的 技术 轨道 未 成 型 时 ,判断 ”轨道 的 更 迭 期 ,该 视角 识别 更 准 

它 的 转换 其 确 ,实施 较为 简便 
机 器 学 习 算法 ”针对 多 源 数据 ,借助 神经 网 络 及 ”可 以 处 理 大 体 量 的 复杂 数据 , 利 
模型 识别 法 深度 学 习 等 算法 模型 ,预测 主题 ”用 算法 对 参数 模型 进行 优化 , 提 


发 展 趋势 高 识别 的 准确 度 


2.3 识别 方法 存在 的 主要 问题 
2.3.1 侧重 热点 监测 而 非 早期 识别 

从 识别 的 阶段 来 看 ,当前 研究 并 未 有 效 捕捉 突破 
性 创新 主题 的 “早期 信号 ” ,造成 识别 时 清 。 现 有 方法 


发 展 模式 不 同 ,难以 提炼 出 普 适 
性 的 衡量 指标 
需要 多 次 试验 寻找 合适 的 算法 
模型 ,对 研究 人 员 的 专业 知识 有 
BER 
大 多 是 在 研究 领域 的 快速 发 展期 或 成 熟 期 进行 热点 主 
题 的 探测 , 而 非 早期 识别 ,导致 前 上 脆性 预 判 不 足 “。 
很 多 突破 性 创新 几乎 没有 早期 迹象 可 供 测度 ,阶段 越 
T ,信息 越 少 ,识别 难度 越 大 。 知 识 的 新 颖 度 很 难 用 可 


TELLIS!9°) 杨国忠 和 陈 佳 140] 


J. Mao 等 I41] 、 徐 路 路 和 王 
0) 自如 江 等 [1 
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量化 的 指标 来 计算 ,同时 在 创新 过 程 中 伴随 着 诸多 不 
确定 性 ,释放 出 的 早期 信号 携带 的 信息 也 具有 不 确定 
性 ,而 且 对 未 来 的 影响 也 具有 不 确定 性 ,因此 难以 在 较 
早 阶段 探测 突破 性 创新 。 
2.3.2” 弱 关 系 挖掘 分 析 不 够 深入 

在 识别 突破 性 创新 的 实现 手段 方面 , 现 有 方法 大 
多 针对 “ 强 信号 ”, 如 高 被 引 、 高 下 载 量 的 文献 开展 分 
析 。 在 主题 聚 类 过 程 中 , 共 词 分 析 常 采用 的 也 是 高 频 
词 ,低频 词 所 形成 的 主题 簇 团 无 法 体现 ,不 能 很 好 地 展 
现 学 科 领 域 的 发 展 全 貌 。 突 破 性 创新 在 萌芽 之 初 , 往 
往 以 主题 间 微 弱 关 联 ( 弱 关系 ) 的 形式 存在 ,这 些 弱 关 
系 代表 了 与 高 频 词 和 强 关系 不 同 的 数据 对 象 , 可 能 
映 事物 真实 的 性 质 ,对 该 类 型 数据 的 忽略 可 能 导致 重 
要 信息 的 遗漏 。 但 由 于 技术 水 平和 研究 人 员 认 和 
水 至 的 限制 , 弱 关 联 关系 仅 作为 一 个 附加 关注 对 象 , 充 
当 简 单 的 辅助 监测 手段 ,而 没有 被 充分 挖掘, 更 缺乏 能 
够 明确 地 从 弱 信 号 视角 识别 突破 性 创新 的 研究 。 
2@33 缺乏 普 适 的 突破 性 创新 主题 演化 规律 
< 于 从 整体 的 学 科研 究 角度 来 看 ,识别 突破 性 创新 , 需 
DP 解 其 产生 前 后 的 知识 状态 ,对 知识 扩散 过 程 有 整 
体 虞 认识。 主题 演化 规律 可 以 揭示 科技 创新 过 程 中 主 
题 的 产生 发展 演变、 消亡 等 过 程 ,依据 该 规律 通过 分 
桥 祝 一 学 科 领 域 现在 的 知识 状态 推断 后 续 的 发 展 赵 
DE 。 已 有 研究 人 员 注意 到 这 个 问题 ,引入 时 间 序 
注 主题 词 之 间 的 深层 次 语义 关联 ,尝试 对 主题 的 
演 兹 路 径 进行 分 析 , 捕 获 演化 规律 。 但 是 结果 往往 具 
有 局 限 性 , 主要 是 两 方面 的 原因 :一 方面 是 科学 发 展 受 
到 往 多 不 确定 性 因素 的 影响 ,难以 用 确定 的 规律 来 描 
绘 路 径 ; 另 一 方面 是 设计 的 量化 测量 方法 难以 展现 准 
确 的 主题 演化 规律 ,不 具有 领域 的 可 迁移 性 ,规律 的 有 
效 性 难以 有 效 验 证 。 


3 ”能 信号 及 其 识别 与 应 用 


科学 研究 的 本 质 在 于 探索 未 知 ,客观 事物 具有 无 
限 性 、 发 展 性 ,科学 是 一 个 不 断 修正 的 过 程 ,研究 过 程 
受到 很 多 不 确定 性 因素 的 影响 ,因此 科学 结论 都 有 它 
的 条 件 和 适用 范围 ”。 本 文 考虑 科学 发 现 中 伴随 的 
不 确定 性 ,将 弱 信 号 引入 突破 性 研究 的 识别 中 。 重 点 
关注 突破 性 创新 的 早期 “预警 信号 ” ,借鉴 各 种 弱 信 号 
捕获 分 析 方法 ,解析 零散 弱 信 号 之 间 的 关联 并 加 以 深 
度 挖掘 ,为 突破 性 研究 的 早期 预测 提供 可 能 性 。 

3.1 弱 信 号 的 相关 概念 
“信号 ”一 词 最 早出 现在 电子 通讯 及 军事 领域 ,一 


m 


7 


般 包 含 光 信号 、 声 信号 和 电信 号 。 它 是 一 种 可 以 觉察 
的 物理 量 或 脉冲 (如 电压 .电流 、 磁 场 强度 等 等 ) ,是 运 
载 信息 的 载体 “ 。 初 期 信号 往往 携带 着 预示 未 来 发 
展 的 有 效 信息 ,但 强度 较 弱 ,不 易 被 感知 与 接收 。 目 
前 , 随 着 技术 手段 的 不 断 发 展 , 被 噪声 掩盖 的 微弱 信号 
的 检测 越 来 越 受到 人 们 的 重视 ,对 弱 信 号 的 研究 也 渐 
渐 由 工程 技术 领域 转向 社会 管理 领域 。 通 过 调研 相关 
文献 ,发现 以 下 3 个 领域 对 弱 信 号 的 概念 进行 了 诸多 
讨论 : 
3.1.1 市 场 经 济 学 角度 

市 场 经 济 学 领域 认为 信号 是 帮助 理性 人 做 出 价值 
判断 的 信息 集合 , 它 并 不 全 是 有 形 的 ,这 一 概念 超越 了 
通讯 领域 中 信和 号 的 含义 。 美 国 经 济 学 家 斯 宾 塞 首次 运 
用 “市 场 信号 ”这 一 概念 ,将 其 解释 为 市 场 上 卖方 向 买 
方 发 出 代表 着 产品 或 其 他 交易 对 象 质量 的 信号 ,可 减 
少 信息 不 对 称 造成 的 影响 1。0. Heil 和 T. S. Robert- 
son 将 市 场 信号 定义 为 对 潜在 行动 的 宣告 和 预演 ,将 市 
场 信号 与 市 场 行为 区 别 开 来 ,认为 市 场 信号 仅 能 预示 
某 种 可 能 的 市 场 行为 ,并 不 一 定 会 真实 发 生 ,依据 携带 
过 息 量 大 小 可 以 分 为 强 信号 和 弱 信 和 号? G. S. Day 
和 P. J. H. Schoemaker 指出 弱 信号 是 较为 模糊 的 、 不 确 
定 的 , 常 与 大 量 的 噪音 混合 在 一 起 ,忽视 这 些 信和 号 可 能 
会 使 企业 丧失 新 的 市 场 ,将 发 展 机 会 让 给 对 手 ” 。 
3.1.2 企业 战略 规划 角度 

在 企业 战略 规划 方面 ,再 Ansoff 首先 提出 弱 信 号 
的 概念 ,用 于 应 对 企业 战略 管理 领域 的 战略 突袭 问题 。 
他 将 弱 信 和 号 描述 为 对 企业 未 来 发 展 具 有 不 确切 影响 的 
早期 迹象 .征兆 或 事件 ,并 将 信和 号 的 强度 和 公司 的 分 级 
响应 联系 起 来 ”” 。B. Coffman 做 了 更 详细 的 解释 ， 
提出 弱 信 和 号 存在 的 具体 表征 类 型 :可 能 影响 企业 环境 
发 展 的 想法 一 个 组 织 所 面临 的 威胁 或 机 会 ;企业 成 长 
和 发 展 可 以 借助 的 事物 等 。 同样 地 ,J. S. Brown 认 
为 要 获得 并 保持 竞争 优势 ,处 于 动荡 环境 中 的 公司 需 
要 扫描 业务 环境 ,以 捕捉 早 期 的 微弱 信号 ,经 分 析 利 用 
使 之 成 为 新 的 战略 洞察 力 的 来 源 “ 。 赵 小 康 将 弱 信 
号 应 用 在 竞争 环境 中 ,指出 利用 好 弱 信 号 ,可 以 对 产品 
发 展 变化 、 组 织 长 期 运行 或 行业 趋势 波动 做 出 早期 判 
断 '“ 。 邓 胜利 等 从 竞争 情报 角度 分 析 , 认 为 弱 信 号 是 
有 预见 性 的 、 模 糊 零 碎 的 .形式 和 来 源 多 样 的 迹象 符 
号 ,对 企业 面向 未 来 的 决策 具有 战略 意义 了 。 
3.1.3 未 来 学 角度 

以 芬兰 学 者 为 首 的 研究 人 员 从 未 来 学 的 角度 对 弱 
言 号 的 内 涵 进 行 了 讨论 。0. Kuusi 等 运用 德尔 菲 法 协 
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调 专家 进行 交流 ,整理 出 两 种 相互 矛盾 的 观点 :@ 弱 信 
号 是 预示 未 来 变化 的 早期 预警 ,多 个 弱 信 号 结合 后 信 
号 增强 。 重 要 性 取决 于 信和 号 接收 者 的 认 知 能 力 ,通常 
被 行业 先驱 先 感知 ,而 不 是 专家 ;@ 弱 信号 通常 对 未 来 
结果 产生 根本 影响 ,是 一 种 客观 现象 ,不 依赖 于 接收 者 
而 存在 。 随 着 时 间 流 逝 逐 渐 增 强 ,专家 最 有 能 力 对 其 
识别 。 针 对 上 述 专家 讨论 结果 中 弱 信 号 内 涵 的 非 
一 致 性 ,M. Moijanen 总 结 了 研究 人 员 对 弱 信 和 号 的 3 种 
理解 : 弱 信 号 既 与 现象 相关 联 , 也 与 结果 相关 ; 弱 信 号 
仅 代 表 着 正在 变化 的 现象 ; 弱 信 号 只 是 一 个 预示 着 未 
来 变化 的 征兆 。R. Pitkänen 反对 在 未 来 学 的 研究 中 
使 用 弱 信 号 ”这 一 术语 ,认为 信号 需要 发 送 者 ,但 弱 
信和 号 的 发 送 器 往往 不 明确 。 未 来 学 家 对 弱 信 号 的 讨论 


多 为 主观 推断 ,缺乏 严谨 的 理论 定律 加 。E. Hiltunen 
在 符号 三 元 组 模型 基础 上 ,从 信号 的 数量 、 信 号 背后 北 
含 的 信息 及 对 于 信号 的 理解 3 个 维度 解读 弱 信号 ,并 
指出 任 一 维度 的 上 升 都 会 使 得 弱 信 和 号 增强 。 

由 各 领域 研究 人 员 对 于 弱 信 号 的 研究 可 以 看 出 ， 
分 析 弱 信号 可 以 辅助 尽早 了 解 和 控制 事物 的 未 来 发 
展 , 在 科技 信息 领域 ,也 应 该 对 不 同 表征 形式 的 弱 信 和 号 
加 以 捕获 、 利 用 ,尽早 挖掘 出 其 潜在 价值 。 
3.2 HSH 

研究 人 员 对 弱 信 号 的 内 涵 表 述 形式 多 样 ,但 包含 
了 诸多 共同 点 ,如 影响 具有 不 确定 性 、 碎 片 化 .解读 的 
复杂 性 可 演化 成 趋势 和 引导 未 来 变化 等 。 本 文 归 纳 
整理 了 弱 信号 的 特征 描述 如 表 5 所 示 : 


T RS 弱 信 号 的 特征 

,一 特征 特征 描述 代表 性 研究 
wy 

oye 弱 信号 是 不 完全 信息 ,广泛 而 分 散 , 量 小 且 难 以 理解 ,相关 性 不 强 , 很 少 引 起 重视 H. Lesca 和 N. Lesca[@] P. J. H. Schoemaker 
(© 等 [691 \ 邓 胜利 等 1] 

Orat 弱 信 号 具有 一 定 的 持续 性 , 它 从 第 一 次 出 现 到 成 为 强 信号 或 消失 需要 持续 一 段 时 间 O. Kuusi 4138] . 单 彬 [64] 

Onis 表现 在 两 个 方面 : 弱 信 号 蕴含 的 信息 本 身 模糊 不 清 ;含义 清晰 明确 ,但 对 未 来 的 影响 具有 不 。 HilunentG] ,党 倩 娜 [661 

<P 确定 性 

Cine iL 性 弱 信 号 只 与 某 些 潜在 的 事情 或 现象 有 关 , 其 作用 无 法 立即 显现 ,但 会 带 来 较 大 的 后 果 和 影 M. Moijanen[59] „P. Rossel[67] C. Park 和 S. 
foe) 响 Cho[68] 

CN Emt 。 弱 信 号 代表 的 信息 是 客观 存在 的 ,但 其 效用 和 意义 往往 跟 接收 者 紧密 联系 ,这 个 层面 来 讲 P. Saul!) T. Kuosal 70) , 董 尹 等 5 
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由 表 5 可 知 , 弱 信号 是 突破 性 创新 的 早期 表现 形 
之 突破 性 创新 在 早期 阶段 是 以 弱 信 号 的 形式 出 现 ， 
j 戎 时 间 的 推移 , 弱 信号 逐渐 增强 ,更 容易 被 监测 人 员 
捕 移 。 因 此 关注 早期 弱 信 号 的 获取 与 分 析 使 得 突破 性 
创 里 的 早期 识别 成 为 可 能 。 

吕 暗 信号 存在 多 种 形式 ,B._ Coffman 作出 了 很 详细 地 
划分 ,认为 日 常生 活 中 有 3 种 类 型 的 弱 信号 在 我 们 身 
边 传递 :已 经 超越 了 我 们 的 感知 , 且 没 有 能 力 接收 ;在 
我 们 的 感知 范围 内 ,但 就 我 们 自身 的 认 知 能 力 无 法 识 
别 ;能 够 被 识别 并 且 会 对 我 们 的 行为 产生 影响 , 带 来 改 
变 59 。 因 此 ,突破 性 创新 在 早期 阶段 如 何 捕获 蕴含 洪 
在 价值 的 弱 信 号 是 研究 的 关键 。 
3.3 弱 信 号 的 识别 方法 

通常 情况 下 , 随 着 事物 的 产生 、 发 展 ,有 一 些 线索 
和 迹象 不 断 显 露出 来 ,经 过 积累 . 序 化 ,形成 具有 明确 
指向 性 的 信息 。 在 整个 过 程 中 , 弱 信号 由 弱 变 强 的 过 
程 ,时 间 跨 度 较 长 ,要 实现 在 更 早 阶段 识别 出 弱 信 
号 并 加 以 利用 ,应 需要 研究 人 员 主 动 地 发 气 、 筛 选 。 弱 
信号 最 初 在 电子 通信 工程 领域 的 分 析 利 用 较为 广泛 ， 
研究 人 员 常 运用 混沌 振子 检测 法 探测 弱 信 号 。C. Deng 


AS. Zhang 将 Lorenz 系统 方法 与 遗传 算法 相 结 合 提 
出 将 改进 的 混沌 振子 方法 用 于 检测 低 信 噪 比 的 正弦 信 
号 ,仿真 结果 证 明了 该 方法 在 微弱 信号 的 探测 中 的 有 
效 性 ” 。 国 育 家 采用 滑 模 变 结构 控制 法 改进 霍 尔 姆 
斯 型 Duffing 系统 ,仿真 结果 表明 改进 后 的 系统 可 以 有 
效 抑制 噪声 ,并 通过 系统 的 功率 谱 图 检测 出 弱 信 和 号 的 
频率 。 在 其 他 管理 科学 领域 中 也 开始 注重 弱 信 和 号 
的 研究 ,衍生 出 一 系列 相 适 应 的 识别 方法 。 
3.3.1 环境 扫描 法 

弱 信 号 与 噪声 混杂 在 一 起 ,在 传递 过 程 中 ,噪声 会 
降低 弱 信 号 的 可 探测 性 ,需要 将 其 过 滤 掉 。 但 是 从 模 
糊 的 周边 环境 获取 并 解读 弱 信 号 是 非常 复杂 的 过 程 ， 
过 滤 不 当 的 话 容易 得 出 错误 的 结论 。 

H. I. Ansoff FI E. J. Mcdonnell 提出 从 不 确定 性 的 
感知 到 最 后 辅助 决策 ,需要 经 过 3 层 筛选 :监视 层 : 
弱 信 号 在 这 层 被 捕获 ,从 企业 所 在 的 商业 环境 中 收集 
各 类 信息 ;@ 心 智 层 :将 获得 的 弱 信 号 进行 迭代 ,通过 
经 验 和 假设 评估 信和 号 的 关联 性 和 价值 ;@ 推 进 层 :将 形 
成 的 信息 用 于 决策 支撑 ' 。R. Wagner 等 提出 网 络 环 
境 下 的 新 型 扫描 方法 ,运用 信息 砚 食 理论 向量 空间 模 
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型 等 逐步 过 滤 ,获取 有 潜在 价值 的 弱 信 号 。 

E. Amanatidou 等 认为 使 用 地 平 线 扫描 弱 信 号 要 有 
两 个 阶段 :中 探索 式 扫描 ,是 指 用 关键 词 进行 广泛 扫 
描 , 之 后 进行 评估 .选择 和 聚 类 ;@) 议 题 聚 焦 式 扫描 ,是 
指 对 已 获得 的 弱 信 号 进行 评价 ,分析 额外 的 信号 来 源 ， 
进行 次 级 弱 信 号 识别 。 
3.3.2 情景 分 析 法 

情景 分 析 法 主要 是 通过 详细 、 绩 密 的 推理 将 弱 信 
号 放大 ,建构 出 未 来 多 种 可 能 的 情景 。 通 过 不 断 地 信 
息 修正 ,使 有 价值 的 弱 信 和 号 逐渐 明晰 ,减少 认 知 上 的 偏 
KES 。 但 该 方法 所 需 的 推理 环节 比较 多 ,不 断 修正 情 
景 耗 费 的 时 间 比 较 长 ,同时 推理 具有 较 强 的 主观 性 ,对 
研究 人 员 的 背景 知识 要 求 较 高 。 

=P. J. H. Schoemaker 等 结合 情景 规划 法 和 商业 分 

析 庆 法 等 ,加 快 弱 言 号 从 弱 转 强 的 速度 ,设计 出 "战略 
晨 通 "工具 ,交付 美国 国防 后 勤 局 使 用 。V. Kaut- 
All E. Ravalet 对 样本 人 口 进行 调查 ,重点 关注 人 
Lah HK AY BS 信号 ,借助 情景 规划 的 方法 推测 出 
2050 年 法 国 可 能 存在 的 人 口 流动 趋势 。P. Meissner 
等 构建 了 整合 内 外 部 专家 判断 的 结构 化 框架 ,用 于 监 


是 用 数学 模型 来 描述 连续 性 行动 突然 中 断 导致 的 质变 
过 程 ,被 用 来 认识 和 预测 复杂 的 系统 行为 ”"' 。 当 系统 
达到 某 个 临界 点 时 ,很 小 的 扰动 都 有 可 能 引起 突变 。 
这 时 系统 从 扰动 中 恢复 的 速率 变 慢 , 恢 复 能 力 变 小 的 
现象 称 为 临界 慢 化 ,该 现象 的 前 兆 信 号 有 :恢复 变 慢 、 
系统 自 相 关系 数 增 大 ,波动 方差 增 大 。 这 种 识别 方 
法 的 关键 在 于 检测 到 微弱 前 兆 信 号 后 采取 行动 防止 系 
统 过 渡 或 为 过 渡 提 前 做 好 准备 。 

吴 浩 等 利用 方差 和 自 相关 系数 系数 这 两 个 指标 分 
析 计 算 序列 (原始 观测 资料 与 参考 气候 态 的 距 平 ) , 检 
测 气 候 突变 前 兆 信号 的 可 捕捉 性 ,并 探讨 了 两 种 前 兆 
害 号 对 信 噪 比 不 同 的 资料 的 适用 性 ” 。M. Scheffer 认 
为 临界 慢 化 现象 仅 能 说 明 过 渡 到 新 的 未 知 状态 的 可 能 
性 增加 ,但 并 非 是 转换 状态 的 特定 预警 信号 R.J. 
Perla 和 J. Carifio 指出 库 恩 提出 的 渐进 性 创新 和 变革 
性 创新 分 别 对 应 突变 现象 中 原本 的 连续 性 变化 和 在 临 
界 点 上 的 突变 ,所 以 运用 突变 论 的 形式 来 构架 科学 认 
识 论 的 框架 是 合乎 逻辑 的 。 
3.3.5 机 器 学 习 手段 检测 法 

大 数据 时 代 , 弱 信号 的 识别 越 来 越 依 靠 专门 的 技 


测 利 讨论 情景 规划 过 程 中 的 盲点 和 微弱 信号 ,并 以 德 
建筑 业 为 例 ,论证 了 方法 的 有 效 性 7” 。 


AR 


3.3 冯 ”模糊 综合 评价 法 
.二 模糊 综合 评价 法 是 一 种 基于 模糊 数学 的 综合 评价 
六 笑 , 依 据 模糊 数学 的 隶属 度 理论 量化 不 完全 信息 。 


术 手 段 。 当 前 主要 通过 文本 挖 据 、 贝 叶 斯 网 络 ,潜在 语 
义 分 析 和 局 部 异常 因子 等 方法 对 弱 信 号 进行 侦 测 , 获 
取 可 能 存在 的 弱 信 号。 

J. Yoon 提出 一 种 基于 关键 字 的 文本 挖掘 方 法 来 
识别 弱 信 号 主题 ,并 利用 与 太阳 能 电池 相关 的 网 络 新 


处 再 时 的 主要 步骤 有 :@D 信 息 筛选 :根据 任务 需求 收集 
信息 ,并 对 收集 到 的 模糊 信息 进行 筛选 ;@ 信 息 测度 : 
栋 据 研究 精度 给 筛选 出 的 信息 评判 等 级 ,依据 其 重要 
性 确定 权重 ;@ 计 算 综合 评价 :采用 模糊 算 子 综合 评价 
SEO” 。 弱 信号 携带 的 信息 具有 不 确定 性 ,该 方法 可 
以 将 对 信息 的 模糊 判断 转化 成 定量 分 析 ,预测 变化 的 
趋势 。 该 方法 适用 于 需要 尽快 获得 分 析 结 果 ,但 信息 
量 较 少 的 情况 。 
邓 胜 利 等 引入 模糊 集合 理论 ,运用 层次 分 析 法 确 
定 弱 信 号 特征 因素 的 权重 ,通过 隶属 度 计算 对 企业 况 
争 的 弱 信号 进行 定量 识别 。 董 尹 和 刘 千 里 在 供应 
链 风 险 弱 信号 的 识别 中 引入 模糊 逻辑 ,运用 模糊 TOP- 
SIS 方法 进行 观测 描述 ,借助 仿真 算 例 检 验 了 方法 的 适 
用 性 '” 。 这 种 方法 在 将 模糊 信息 定量 化 处 理 时 ,权重 
赋值 受 主 观 影响 较 大 ,缺乏 客观 性 。 
3.3.4 ”突变 理论 识别 法 

突变 现象 在 自然 界 中 是 普遍 存在 的 ,科学 的 发 展 
与 变革 也 具有 渐变 到 突变 、 自 组 织 等 特征 "突变 理论 


Sey 


闻 对 该 方法 进行 验证 ,从 可 见 度 .扩散 程度 和 速率 增加 
性 几 个 指标 来 识别 弱 信 和 号” D. Thorleuchter 和 D. P. 
Vanden 运用 潜在 语义 索引 和 文本 挖掘 的 方法 对 网 络 
言 息 进行 聚 类 分 析 ,抽取 出 有 用 的 弱 信 号 ”韩国 科 
技 信息 研究 院 (Korea Advanced Institute of Science and 
Technology ) 开发 的 新 兴 趋 势 信 号 (New and Emerging 
Signals of Trends, NEST) 模型 ,搜集 来 自 全 球 专家 网 络 
的 信息 ,结合 定性 和 定量 方法 ,使 用 贝 叶 斯 网 络 聚 类 ， 
通过 模式 识别 和 交叉 影响 分 析 系 统 地 探测 弱 信 号” 。 
J. Kim 和 C. Lee 应 用 文本 挖掘 、 局 部 利 群 因子 及 信和 号 
组 合 图 等 组 合 方法 提高 检测 微弱 信号 的 灵敏 度 ” 。 
G. Joanny 等 运用 文本 挖掘 技术 从 文档 语料库 中 生成 多 
词 概 念 词典 ,然后 获取 包含 词典 内 主题 词 的 数据 集 , 经 
过 3 层 过 滤器 后 获得 最 终 符合 突破 性 技术 预测 的 弱 信 
号 数据 集 ” 。 
3.3.6 弱 信 号 识别 方法 的 比较 分 析 
捕获 到 的 弱 信 号 的 质量 与 分 析 效 果 不 仅 与 早期 信 
号 的 质量 和 数量 有 关 ,还 取决 于 研究 人 员 的 背景 知识 、 
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， 许 海 云 . 突破 性 创新 早期 识别 与 弱 信 号 分 析 综 述 [J]. 图 书 情报 工作 ,2021 ,65(4) :89 - 101. 


经 验 等 认 知 水 平 。 上 述 不 同 的 识别 方法 适用 于 不 同 的 


| 情况 , 优 、 缺 点 也 各 不 相同 ,如 表 6 所 示 : 


表 6 弱 信 号 识别 方法 对 比分 析 


方法 领域 /范围 优点 不 足 

环境 扫描 法 企业 战略 规划 OD 扫描 获取 的 信息 更 加 丰富 ;@ 第 选 器 可 以 。 对 企业 情报 分 析 人 员 的 专业 能 力 要 求 较 高 
层 层 过 滤 掉 噶 音 

情景 分 析 法 宏观 层面 ( 国家 或 全 行业 ) 。。 @ 将 弱 信号 放大 ;加 假设 多 种 不 同 场景 并 不 。 OD 主观 性 较 强 ;加 不 断 补充 信息 进行 修正 耗 
断 补充 信息 ,减少 认 知 偏差 时 较 长 

模糊 综合 评价 法 企业 竞争 情报 @D 和 将 模糊 的 定性 信息 转化 为 定量 信息 ;四 可 。 转化 时 的 标准 及 计算 时 的 各 项 赋值 主观 性 
用 于 快速 决策 强 

突变 理论 识别 法 自然 灾害 及 自然 科学 在 临界 立 什 附近 探测 预 管 信号 ,有 效 避 免 系 临界 慢 化 现象 意味 着 突变 的 可 能 性 较 大 ,但 
统 突变 或 为 突变 提前 做 好 准备 不 一 定 发 生 , 据 此 识别 弱 信 号 的 准确 度 不 高 


机 器 学 习 手 段 检测 法 大 数据 时 代 ( 爆 炸 的 网 络 信息 ) 


中 可 处 理 的 数 


居 量 较 大 ;@) 识 别 出 的 弱 信 号 ”中 对 研究 人 员 的 专业 能 力 要 求 较 高 ;@ 大 体 


由 此 可 见 , 弱 信号 的 识别 过 程 是 一 个 伴随 不 确定 
的 复杂 过 程 , 需 要 收集 尽 可 能 多 的 不 完全 信息 ,从 中 进 
选 王 与 研究 对 象 相关 性 较 强 的 弱 信号 并 加 以 利用 。 突 
本 本 创 新 在 前 芽 之 初 也 是 以 主题 问 的 微弱 关系 的 形式 
而 。 弱 关系 作为 一 种 特殊 的 弱 信号 ,携带 的 信息 往 
全 纪 多 元 化 ,能 反映 领域 的 整体 趋势 ,因此 可 以 提取 有 
PEUTIC , 找 出 它们 的 内 在 联系 ,实现 突破 性 创新 的 
[期 识别。 
N 
4 〇 D 弱 关系 分 析 及 其 应 用 
GN 
41S BRAM AR 
SABRE WERT LES ,M. S. Grannovetter 指出 
Hig ESE ABE AIT a He eH LA BE EB LG 
的 逢 息 同 质 化 程度 较 高 。 弱 关系 是 不 同 群体 间 信 息 流 
通 移 桥梁 ,具有 中 介 性 、 异 质 性 的 特点 ,收集 的 异 质 性 
信息 能 够 给 企业 带 来 新 的 机 会 ,有 助 于 技术 创新 *!。 
因此 , 弱 关系 是 一 个 与 强 关系 相对 立 的 概念 , 指 的 是 在 
网 络 结构 中 节点 间 的 联系 强度 低 于 某 一 阔 值 的 关系 。 
如 图 2 所 示 : 核 心 层 内 各 节点 (黑色 圆 点 ) 直 接连 接 , 节 
点 间 联 系 较为 紧密 ,相对 来 说 属于 强 关 联 关系 ,类 似 于 
知识 网 络 中 关键 词 直接 共 现 。 逐 渐 向 外 扩散 到 中 间 
层 ,各 节点 之 间 ( 三 角形 ) 关系 强度 逐渐 减弱 ,外 圈 层 
内 的 节点 (正方 形 ) 与 中 心 节点 需要 通过 许多 中 间 实 
体 才能 产生 联系 ,同时 它们 彼此 之 间 的 联系 较 少 ,网 络 
结构 较为 稀疏 。 

因为 关系 的 强 弱 是 相对 的 ,具体 测度 时 常 按照 节 
点 间 连 线 的 权重 从 大 到 小 进行 排序 , 设 定 合适 的 阔 值 ， 
FRB UE NRA, BRI RE LIE SE 
系 分 析 中 的 关键 一 环 ,需要 参考 数据 集 的 特点 和 研究 
目的 经 过 多 次 调整 试验 来 确定 。 


HH 于 精准 决策 


量 数据 处 理 耗 时 耗 力 


图 2 网 络 结构 中 的 弱 关系 


4.2， 弱 关系 分 析 的 应 用 

弱 关 系 理论 早期 是 从 社会 学 的 角度 研究 社交 网 络 
的 特点 ,逐渐 被 应 用 到 企业 创新 ,经 济 管理 以 及 科技 信 
息 等 领域 。P. A. Julien 等 在 探讨 中 小 型 陆 基 物流 公司 
的 技术 变革 时 指出 弱 关 系 比 强 关系 更 能 促 发 技术 革 
新 ,对 各 类 弱 关 系 的 分 析 利 用 能 力 越 强 ,公司 变革 也 越 
W, J. Zenou 等 调研 工人 通过 强 关 系 和 弱 关 系 的 网 
络 获得 工作 机 会 的 情况 ,结果 表明 维系 弱 关 系 可 以 有 
效 提高 工人 就 业 率 ,加 快 经 济 发 展 ” 。 刘 俊 婉 等 通过 
构建 美国 科学 院 生 物 学 领域 244 位 院士 的 科学 合作 网 
络 , 对 合作 的 弱 关 系 、 强 关系 以 及 超级 关系 特征 进行 量 
化 分 析 ,发 现 与 名 人 科学 家 合作 由 弱 关 系 成 为 强 关系 
会 加 速 科研 事业 的 上 升 “ 。S. H. Yoo 和 D. K. Won 认 
为 应 该 重点 关注 未 被 选 为 文章 关键 词 的 词 之 间 的 弱 关 
A ,运用 基于 代理 的 模拟 工具 NetLogo 探索 纳米 材料 领 
域 的 技术 创新 动态 行为 ,识别 该 领域 的 未 来 技术 趋 
AON, 

单一 类 型 的 关系 只 能 反映 研究 领域 的 局 部 特征 ， 
因此 要 将 弱 关 系 分 析 应 用 于 突破 性 研究 主题 的 早期 识 
别 中 , 仅 依靠 某 一 种 弱 关 系 是 不 够 的 。 多 元 关系 融合 
算法 模型 可 以 提供 方法 上 的 借鉴 ,使 多 种 弱 关 系 的 有 
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效 融 合成 为 可 能 ,获得 更 为 明确 的 信息 指向 。 
4.3 ” 弱 关 系 的 融合 汇聚 分 析 
该 方法 是 将 获取 到 的 不 同类 型 的 弱 关 联 关系 运 用 


型 难以 捕获 到 节点 间 更 为 复杂 的 依赖 关系 及 路 径 信 
A ,尤其 是 在 复杂 网 络 中 某 一 节点 常常 通过 若干 中 间 
实体 与 另 一 节点 产生 的 关联 关系 ,这 种 弱 关 联 关系 在 


融合 算法 进行 综合 分 析 ,使 弱 关 系 逐 级 增强 ,携带 的 信 
息 逐 渐 明 晰 ,达到 识别 突破 性 创新 的 目的 。 由 图 3 可 
见 : 最 左边 一 列 是 各 种 类 型 的 弱 关 系 ,阶段 一 、 阶 段 二 、 
阶段 三 是 弱 关 系 的 融合 汇聚 过 程 。 首 先 汇 聚 同类 型 的 


数量 上 远 多 于 强 关 系 。 借 鉴 高 阶 网 络 模型 可 以 捕获 分 
析 弱 关系 ,使 得 模糊 信息 通过 增强 、 放 大 分 析 变 得 明 
晰 ,降低 科学 发 展 的 不 确定 性 。 目 前 对 于 高 阶 网 络 的 
研究 主要 有 3 个 方向 :多 层 高 阶 模型 .组合 高 阶 模型 和 


弱 关 系 ,使 微弱 关系 变 得 明显 。 然 后 运用 算法 模型 控 
据 各 类 弱 关 系 背 后 的 关联 ,人 为 地 进行 增强 ,获取 背后 
的 信息 指向 。 最 后 融合 多 种 增强 后 的 弱 关 系 ,试图 找 
到 突破 性 研究 主题 。 整 个 处 理 过 程 会 过 滤 掉 那些 汇聚 
以 后 也 没有 任何 价值 的 弱 关 系 ,使 结果 更 精准 。 


H 
m: 
= H re | l 
Ai E a | | | 明确 的 
2 i sf i 信息 内 
= t; i 容 ( 突 
PS E [ | 破 性 研 
of 究 主题 ) 
oO: | 
和 4 i | 
ti 
O 阶段 一 阶段 二 阶段 三 
N 3 多 种 弱 关 系 的 融合 汇聚 
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CN 当前 已 有 不 少 学 者 对 多 元 关系 的 融合 进行 了 控 
索 它 许 海 云 等 以 基因 工程 疫苗 研发 与 制备 领域 为 例 ， 
和 用 PathSelClus 算法 实现 共 现 关系 、 引 文 关系 与 合 著 
关 寄 的 融合 ,对 比分 析 证 明 ,多 元 关系 融合 可 以 有 效 提 
PIEDRA MUA” S, Jensen 等 采用 元 路 径 方法 将 广 
献 C 主 题词 ,作者 .引文 等 属性 关联 起 来 ,从 不 同 角 度 研 
究 对 象 之 间 的 关联 性 和 相似 性 ,并 用 于 探寻 主题 演 
化 加 。D. Zhang 等 针对 元 路 径 严格 按照 设 定 选取 节点 
的 不 足 , 设 计 基于 元 图 的 方法 引导 随机 游 走 过 程 ,捕获 
更 为 复杂 的 节点 关系 5 。 刘 彤 等 利用 元 矩阵 对 由 专 
利 及 其 属性 构成 的 关系 网 络 进行 表征 ,引入 LDA 算法 
模型 融合 多 重 关 系 ,更 准确 地 识别 核心 专利 "1。C. 
Shi 等 提出 HERec 模型 抽取 不 同类 型 的 节点 序列 进行 
表示 学 习 , 利 用 融合 函数 对 表示 结果 进行 融合 ,实现 社 
区 的 识别 预测 "” 。 现 有 方法 已 经 开始 注意 到 分 析 对 
象 及 其 关系 的 复杂 性 ,未 来 研究 需要 构建 有 效 的 算法 
模型 对 多 个 对 象 或 对 象 之 间 多 种 弱 关 系 反映 出 来 的 各 
种 信息 进行 充分 融合 。 

4.4 高 阶 网 络 中 的 复杂 依赖 关系 

现实 世界 中 的 网 络 环境 越 来 越 复杂 ,传统 网 络 模 


非 马尔 可 夫 高 阶 模型 。 
4.4.1 多 层 高 阶 模型 

该 模型 针对 网 络 系统 实体 间 多 种 链接 类 型 的 复杂 
关系 。 多 层 高 阶 模型 展现 了 实际 的 复杂 网 络 中 多 种 关 
系 类 型 的 交互 作用 , 马 蒙 周 为 了 提升 生物 体 中 度 小 关 
键 基因 的 识别 效率 ,首先 将 同 源 数据 集成 Yeast 和 Hu- 
man 单 层 网 络 构建 多 层 复杂 网 络 , 并 通过 图 论 的 方式 
表示 ;然后 定义 概率 转移 矩阵 描述 单位 时 间 内 基因 节 
点 在 层 内 和 层 间 游 走 动态 的 转换 规则 ,结合 随机 游 走 
算法 模型 选取 合适 的 游 走 系数 ,将 随机 游 走 后 节点 的 
停留 概率 作为 多 层 网 络 的 中 心性 指标 进行 排序 ,提取 
出 关键 基因 ;最 后 验证 该 方法 有 明显 的 优越 性 :识别 出 
的 关键 基因 更 多 更 准确 " "1 。 为 了 最 大 限度 的 保有 网 
络 细 节 信 息 , 有 学 者 引入 “ 张 量 ” 对 多 层 网 络 进 行 分 
析 。L. Gauvin 等 将 多 层 网 络 表示 成 三 阶 张 量 ,展示 出 
三 个 维度 间 的 对 应 关系 。 并 对 网 络 进行 非 负 张 量 分 
解 , 分 解 产生 的 二 维和 矩阵 除了 包含 2 个 节点 与 社区 间 
的 隶属 关系 ,还 将 得 到 1 个 社区 对 应 的 第 三 个 维度 的 
关系 信息 ,如 时 序 网 络 中 可 以 得 到 对 应 时 间 维 度 上 的 
活动 模式 的 二 维和 矩阵 ,该 方法 可 以 充分 利用 各 个 维度 
的 信息 ,从 而 实现 社区 识别 。 
4.4.2 合 高 阶 模型 

该 模型 将 代表 了 复杂 系统 中 实体 间 的 相互 影响 的 
成 对 链接 推广 到 任意 节点 集 的 广义 链接 和 路 径 。 组 合 
高 阶 模型 已 经 从 拓扑 结构 分 析 推 广 到 了 图 的 高 位 分 
析 , 罗 永 恩 等 基于 超 图 模型 ,结合 共享 粹 构建 出 新 的 
特征 整合 方法 ,以 每 个 特征 为 顶点 、 特 征 之 间 的 多 元 
关系 作为 超 边 ,应 用 超 图 分 割 算法 实现 原始 复杂 网 
络 的 聚 类 划分 ,该 方法 识别 准确 率 高 于 线性 支持 向 
HDL BBA EMA TE. A. R. Benson 等 为 
探索 复杂 网 络 中 的 节点 连接 间 的 丰富 信息 ,构建 了 
基于 高 阶 连通 模式 的 聚 类 网 络 通 用 框架 ,将 主题 分 
析 和 网 络 分 区 统一 起 来 ,揭示 复杂 系统 中 的 新 组 织 
模式 和 模块 "| 。 
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4.4.3 非 马尔 可 夫 高 阶 模型 

该 模型 引入 时 间 序 列 数据 ,注重 挖掘 依赖 关系 的 
真实 连接 状态 ,揭示 了 网 络 节点 之 间 的 间接 影响 路 径 。 
J. Xu 等 指出 当 分 析 来 自 复杂 系统 的 序列 数据 如 全 球 
航运 流量 时 ,一 阶 马 尔 科 夫 模 型 认为 网 络 的 下 一 个 状 
态 转 变 仅 依赖 于 当前 节点 的 状态 ,忽略 了 该 转变 可 能 
是 前 儿 个 转变 共同 导致 的 结果 ,使 得 预测 产生 偏差 ,人 研 
究 反 映 了 对 非 马 尔 可 夫 模 型 的 需求 ”| 。R Lambiotte 
等 对 比分 析 了 在 社区 检测 、 节 点 排序 和 系统 动态 演化 
3 个 例子 中 传统 的 网 络 与 非 马 尔 可 夫 高 阶 模 型 分 析 预 
测 的 结果 ,证 明 非 马尔 科 夫 模型 能 够 更 好 地 发 掘 数 据 
背后 的 内 在 联系 ,反映 复杂 网 络 动态 变化 的 真实 情 


(9 弱 信 号 识别 突破 性 研究 的 发 展 趋势 


忆 突 破 性 创新 研究 在 萌芽 初期 往往 是 以 主题 之 间 相 
互 巡 接 的 微弱 关联 的 形式 存在 ,所 以 弱 信 号 是 探索 突 
破 小 创新 的 一 个 很 好 的 切 人 点。 不 同 于 高 频 词 或 高 引 
春 妈 献 此 类 的 强 信号 , 弱 信 号 蕴含 的 信息 更 加 多 元 化 ， 
能 金 反映 学 科 的 整体 知识 结构 。 但 现实 中 很 多 科学 发 
更 入 突破 性 创新 ,可 供 人 们 提前 监测 捕 提 的 早期 迹象 
较 亚 。 而 且 研究 获取 到 的 弱 信号 常 混 杂 着 噪音 ,携带 
的 凌 住 都 是 零碎 的 不 完全 信息 ,能 否 对 其 进行 有 效 关 
别 张 仅 取决 于 研究 人 员 的 知识 储备 和 经 验 累积 ,还 取 
决 手 先进 技术 的 支撑 。 未 来 研究 中 可 以 多 注重 捕捉 有 
效 镶 信号 ,通过 提高 弱 信 号 的 质量 ,提高 识别 结果 的 准 
确 性 。 
5.2 ”重视 突破 性 研究 主题 的 动态 演化 过 程 

突破 性 创新 及 创造 性 的 发 现 不 是 凭空 产生 的 ， 
而 是 在 渐进 性 创新 的 基础 上 发 展 而 来 ,由 量变 到 质 
变 ,实现 突破 。 现 有 的 识别 方法 大 都 只 关注 某 个 时 
间 点 下 的 静态 信号 ,不 能 很 好 地 观测 整个 学 科 领 域 
知识 扩散 的 状况 。 明 晰 学 科 知 识 的 演变 发 展 路 径 ， 
结合 主题 与 主题 之 间 的 关联 关系 ,可 以 动态 地 观察 
主题 产生 和 发 展 的 演化 规律 。 了 解 学 科 领 域内 的 
主题 发 展 状 况 之 后 , 才 有 可 能 捕 提 到 最 具 突破 性 变 
革 潜 力 的 主题 ,进而 跟踪 监测 , 发现 更 多 早期 征兆 。 
因此 ,未 来 研究 可 以 考虑 引入 时 序 分 析 方 法 ,剖析 
主题 的 产生 .发 展 直至 消亡 的 规律 ,尽早 识别 突破 
性 创新 。 


=> 


5.3 利用 高 阶 网 络 模型 分 析 弱 关系 

在 复杂 网 络 中 引入 高 阶 网 络 模型 能 够 关注 更 多 维 
度 的 信息 :中 模型 不 只 关注 节点 之 间 的 相互 影响 ,还 关 
注 到 网 络 中 边 与 边 的 相互 影响 ;@ 将 节点 之 间 的 连接 
关系 分 为 不 同 的 类 型 ;四 考虑 节点 之 间 的 关系 对 全 局 
(网 络 中 每 个 点 ) 的 影响 ;由 关注 到 节点 间 关 联 关系 发 
生 的 时 间 点 和 先后 顺序 。 以 上 这 些 大 部 分 都 是 运用 传 
统 网 络 分 析 方法 时 难以 捕获 到 的 信息 一 一 弱 关 系 , 弱 
关系 在 知识 网 络 图 谱 中 对 于 知识 结构 的 形成 发 挥 了 重 
要 的 作用 ,但 是 背后 的 信息 不 太 容 易 被 感知 。 利 用 高 
阶 网 络 模 型 可 以 更 好 地 挖 据 相互 影响 的 节点 间 真 实 的 
依赖 关系 ,实现 弱 关 系 的 有 效 融 合 。 所 以 未 来 研究 可 
以 尝试 运用 高 阶 模型 ,帮助 捕获 网 络 中 节点 之 间 复 杂 
的 弱 关 联 依赖 关系 ,探寻 真实 的 路 径 信息 ,从 中 发 现 知 
识 发 展 动向 ,追踪 主题 的 动态 演化 过 程 ,实现 突破 性 研 
究 的 早期 识别 。 


6 ”结语 


本 文 首先 对 比分 析 了 现 有 的 突破 性 创新 主题 识别 
方法 ,发现 当前 研究 对 弱 信 号 的 关注 不 够 ,同时 缺乏 对 
学 科 主 题 动态 演化 过 程 的 深入 探索 ,难以 实现 早期 识 
别 。 之 后 ,介绍 了 弱 信 号 的 内 涵 、 特 征 ,归纳 总 结 了 几 
种 弱 信 号 的 捕获 分 析 方 法 ,阐明 弱 信 号 分 析 用 于 突破 
性 创新 早期 识别 的 可 行 性 。 考 虑 到 突破 性 研究 主题 的 
识别 预测 大 多 关注 文献 间 的 引用 关系 、 主 题词 间 的 语 
义 关系 等 关系 类 型 数据 , 接 下 来 研究 着 重 分 析 了 弱 信 
号 的 特殊 类 型 一 一 弱 关 系 ,单一 弱 关 系 反 映 的 信息 有 
限 ,借鉴 融合 算法 模型 能 够 实现 多 种 弱 关 系 的 融合 汇 
聚 ,在 尽 可 能 早 的 阶段 获得 明确 的 指向 性 信息 。 最 后 ， 
提出 未 来 研究 可 以 通过 精准 捕捉 突破 性 创新 早期 的 有 
效 弱 信号 ,分 析 突 破 性 创新 主题 的 动态 演化 规律 ,如 利 
高 阶 网 络 模 型 捕获 分 析 弱 信号 这 种 途径 提高 突破 性 
研究 早期 识别 的 准确 性 。 
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A Review of Early Recognition of Breakthrough Innovations and the Weak Signal Analysis 
Liu Yahui'’* Xu Haiyun * 
! Chengdu Library of Chinese Academy of Sciences, Chengdu 610041 
* Department of Library, Information and Archives Management, School of Economics and Management, 
University of Chinese Academy of Sciences, Beijing 100190 
* Business School, Shandong University of Technology, Zibo 255000 
* Institute of Scientific and Technical Information of China, Beijing 100038 
Abstract: | Purpose/significance | This paper has summarized disadvantages of various recognition methods of 
breakthrough researches by comparing and analyzing these methods. Then this study has introduced weak signals into 
the identification of radical innovation, focusing on various types of weak signal (especially weak ties ) with a view to 
achieving early prediction. | Method/process | Firstly, by analyzing the existing recognition methods, this paper 
marized the main problems and pointed out the necessity of weak signal research. Then, this study introduced the 
‘concept and representation of weak signal from different disciplines summarized the characteristics of weak signal and 
wba several methods of weak signal identification. Finally, this paper introduced the connotation and application 
(6Dweak ties, and proposed that the algorithm model that integrates multiple relationships can realize the effective fu- 
Sign of various weak ties and obtain more clear directional information. | Result/conclusion | In the frontier re- 
esearch , most attention is paid to strong ties such as reference relations between literatures and semantic relations be- 
Geen topic terms. However, weak ties contain more diverse information, and strengthening the analysis of them can 
able early recognition of breakthrough research frontier. In the future, it is necessary to seek effective methods to 
Capture weak ties and further dig out the evolution of the theme such as; using high-order network models to analyze 
weak ties to improve the accuracy of early recognition. 
a== Keywords: radical innovation early recognition weak signal weak linkage multi-relations fusion 
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